课程概述：生成式AI时代的不确定性

COMP5511的第5讲标志着一个关键的转变。我们正从经典计算的确定性逻辑和早期监督学习模型的确定性，转向生成式AI的核心——概率。在本节中，我们将探讨为什么现代AI模型不输出“事实”，而是输出概率分布，揭示使LLM能够写诗、扩散模型能够从噪声中绘图的机制。

生成式AI依赖于从高维概率空间进行采样。无论是生成文本还是图像，模型都在不确定性中导航以产生新颖性：

自主智能体必须在“开放世界”中导航，其中每个动作都带有未知风险和回报。

幻觉的权衡

纯粹的确定性模型是安全的，但缺乏原创性。通过拥抱不确定性，我们实现了创造力，但也引入了幻觉——即模型自信地生成看似合理但错误的信息的风险。

概念采样逻辑

定义函数生成响应提示,温度：
计算概率分布所有可能词元的；
调整分布，基于温度温度（越高 = 更多样化,，越低 = 更聚焦）；
选择下一个词元，使用加权随机选择；
重复直到完成。

概率建模

现代AI通过统计学的视角看待世界，而非二元真理。